机译:真棒:融合的一般多智能体学习算法 自我发挥并学习对抗固定对手的最佳反应
机译:真棒:一种通用的多主体学习算法,可以自我玩法收敛,并学习对静止对手的最佳反应
机译:自我玩耍和使用专家学习时差学习的五子棋游戏
机译:一种通用的强化学习算法,可掌握国际象棋,将棋和自打法
机译:令人敬畏的:一种通用的多主体学习算法,可在自玩游戏中收敛并学习对平稳对手的最佳反应
机译:协同多主体系统并发学习算法的分析与设计。
机译:神经学家得知算法运动学习
机译:令人敬畏:一种通用的多智能学习算法,可以在自我发挥中收敛并学习对抗静止的对手的最佳反应